智能论文笔记

Avast-CTU Public CAPE Dataset

Branislav Bosansky , Dominik Kouba , Ondrej Manhal , Thorsten Sick , Viliam Lisy , Jakub Kroustek , Petr Somol

分类：人工智能 | 机器学习

2022-09-06

有限的公开数据可以支持恶意软件分析技术的研究。特别是，几乎没有由杜鹃/斗篷等丰富的沙盒生成的公开可用数据集。使用动态沙箱的好处是对目标机中文件执行的逼真模拟并获得该执行日志。机器可以被恶意软件感染，因此很有可能在执行日志中捕获恶意行为，从而使研究人员可以详细研究这种行为。尽管随后对日志信息的分析在工业网络安全后端被广泛介绍，但据我们所知，仅在学术界投入了有限的努力，以使用最先进的技术提高此类日志分析功能。我们使此示例数据集可用来支持设计新的机器学习方法以进行恶意软件检测，尤其是用于自动检测通用恶意行为。该数据集是在Avast软件和捷克技术大学-AI中心（AIC）之间合作的。

translated by 谷歌翻译

Explaining Classifiers Trained on Raw Hierarchical Multiple-Instance Data

Tomáš Pevný , Viliam Lisý , Branislav Bošanský , Petr Somol , Michal Pěchouček

分类： (统计)机器学习 | 机器学习

2022-08-04

从原始数据输入中学习，因此限制了功能工程的需求，是机器学习方法在各个域中的许多成功应用的组成部分。尽管许多问题自然地转化为直接在标准分类器中使用的矢量表示形式，但许多数据源具有结构化数据互换格式的自然形式（例如，以JSON/XML格式使用的安全日志）。现有方法，例如在层次多实例学习（HMIL）中，允许以原始形式从此类数据中学习。但是，对原始结构化数据培训的分类器的解释仍然在很大程度上尚未探索。通过将这些模型视为子集选择问题，我们证明了如何使用计算有效算法来生成具有优惠属性的可解释解释。我们与图形神经网络采用的解释技术进行比较，该技术显示了速度加速和更高质量的解释的顺序。

translated by 谷歌翻译

Robot's Gendering Trouble: A Scoping Review of Gendering Humanoid Robots and its Effects on HRI

Giulia Perugia , Dominika Lisy

分类：机器人

2022-07-03

在过去的几年中，围绕种族类人体机器人的有问题实践的讨论已经上升。为了彻底理解机器人在人类机器人互动（HRI）社区中如何理解机器人的“性别” - 即如何被操纵，在哪些环境中以及其对人们的看法和人们产生哪些影响的影响，为基础建立基础。与机器人的互动 - 我们对文献进行了范围的评论。我们确定了553篇与我们从5个不同数据库中检索的评论相关的论文。审查论文的最终样本包括2005年至2021年之间的35篇论文，其中涉及3902名参与者。在本文中，我们通过报告有关其性别的目标和假设的信息（即操纵性别的定义和理由），对机器人的“性别”（即性别提示和操纵检查），对性别的定义和理由进行彻底总结这些论文。（例如，参与者的人口统计学，受雇的机器人）及其结果（即主要和互动效应）。该评论表明，机器人的“性别”不会影响HRI的关键构建，例如可爱和接受，而是对刻板印象产生最强烈的影响。我们利用社会机器人技术和性别研究中的不同认识论背景来提供有关审查结果的全面跨学科观点，并提出了在HRI领域前进的方法。

translated by 谷歌翻译

Fast Algorithms for Poker Require Modelling it as a Sequential Bayesian Game

Vojtěch Kovařík , David Milec , Michal Šustr , Dominik Seitz , Viliam Lisý

分类：人工智能

2021-12-20

在不完美的信息游戏中最近的最近结果仅适用于，或评估，扑克和扑克和扑克等游戏，如骗子的骰子。我们争辩说，连续的贝叶斯游戏构成了一类自然游戏，以概括这些结果。特别地，该模型允许优雅地制定反事实遗忘最小化算法，称为公共州CFR（PS-CFR），其自然地将其自身用于有效的实现。经验，通过公共国家CFR求解10 ^ 7个态的扑克排放量需要3分钟和700 MB，而VANILLA CFR的可比版本需要5.5小时和20 GB。此外，CFR的公共规定开辟了利用域特异性假设的可能性，导致在扑克和其他领域的香草CFR上渐近复杂性（和进一步的实证加速）二次减少。总体而言，这表明能够将扑克代表作为顺序贝叶斯游戏在基于CFR的方法的成功中发挥了关键作用。最后，我们将公共州CFR扩展到一般广泛形式的游戏，争论这种延伸享有一些 - 但不是全部的歌曲贝叶斯游戏的福利。

translated by 谷歌翻译

Hierarchical Multiple-Instance Data Classification with Costly Features

Jaromír Janisch , Tomáš Pevný , Viliam Lisý

分类：机器学习 | 人工智能 | (统计)机器学习

2019-11-20

我们通过使用提供各种信息的远程服务对恶意Web域进行分类的现实问题来激励我们的研究。至关重要的是，可以将其中的某些信息进一步分为一定深度，并且此过程顺序创建了层次结构化的多种现实数据树。发送到远程服务的每个请求都与成本（例如，时间或其他请求的其他费用）相关联，目的是最大程度地提高准确性，并以预算约束。我们提出了一个通用框架，能够处理一系列类似问题。我们的方法基于具有昂贵的特征（CWCF），分层多样性学习（HMIL）和动作空间的层次分解的分类。它与描述为各种特征的部分特征（类似于JSON/XML文件）的样本一起使用，该树可以用复杂的结构对数据进行建模。该过程被建模为马尔可夫决策过程（MDP），其中一个状态代表获得的功能，而动作选择但未知的功能。该政策经过深入的强化学习培训，我们通过现实世界和合成数据来演示我们的方法。

translated by 谷歌翻译